BPStudy-133 Pythonによる機械学習・データ分析
Pythonによる機械学習・データ分析
#BPStudy の 参加ログです。
第1部 書籍「Pythonによるあたらしいデータ分析の教科書」特集
「Pythonによるあたらしいデータ分析の教科書」の概要とターゲット読者 (19:00〜19:20)
BPStudy#133〜Pythonによる機械学習・データ分析 - connpass
寺田 学 (Twitter: @terapyon )
2018年9月19日に発売される書籍、「Pythonによるあたらしいデータ分析の教科書」(翔泳社) の概要やコンセプトを知ってもらい、対象の読者を示し、他の書籍との比較を説明します。
この講演を通じて、自分自身や同僚の中でこの本の対象読者がいるかどうか考えてもらえるようになると思います。
https://pbs.twimg.com/media/Dn7ouG5XkAArQyT.jpg
資料 https://slideship.com/users/@terapyon/presentations/2018/09/4GwSc9zp9TUs2bZeEXRJqD/
本の紹介
Pythonによるあたらしいデータ分析の教科書
https://www.shoeisha.co.jp/static/splus/1634/book/image/9784798158341.jpg
コンセプト
教科書である = 書きすぎていない
データ分析エンジニア向け
他の本との比較
/terapyon-books
本を作ることにした動機
認定試験のためのちょうどよい本がなかった
認定試験のための教科書とするために執筆
機械学習と数学 (19:20〜19:40)
BPStudy#133〜Pythonによる機械学習・データ分析 - connpass
辻 真吾 (Twitter: @tsjshg )
機械学習の基本的な理論は、数学で記述されています。そんな機械学習アルゴリズムも、利用するだけであれば数学をほとんど知る必要はありません。
忙しいITエンジニアにどこまで数学が必要か?という課題に目を向けつつ、数学を学ぶ意味や利点はどこにあるのかについてお話しします。また、どのように学べば良いのかについても考えて行きたいと思います。
https://pbs.twimg.com/media/Dn7tRFEUwAAMf-g.jpg
機械学習と数学、どこまで必要なのか
アルゴリズムを作る人
アルゴリズムを実装する人
アルゴリズムを使う人 (←今日のターゲット!)
ロジスティック回帰
単回帰
$ y=ax+b
シグモイド関数
$ y=\frac{1}{{1+e^{-ax}}}
数式からどういう変化が現れるかを把握する難しいけど、コンピュータに書いてもらえば良い
Pythonによるあたらしいデータ分析の教科書 P57
学び方
全体像を理解する
目的駆動学習でやる
目的をもってやってみて、分からなかったら調べてみる
オススメ資料
主成分分析の全体像が分かる http://manabukano.brilliant-future.net/document/text-PCA.pdf
まとめ
Pythonのコードが書ければ、コンピュータの助けを借りながら勉強できるぞ
機械学習入門としてのscikit-learnとの付き合い方 (19:40〜20:00)
BPStudy#133〜Pythonによる機械学習・データ分析 - connpass
福島 真太朗(Twitter: @sfchaos )
機械学習を勉強するにあたり,scikit-learnなどを用いて実際に動かしながら理解していくことは重要です.
具体的にどのように勉強していけば良いのかについて,scikit-learnのインタフェースの理解,ドキュメントの読解,各アルゴリズムのパラメータの挙動などを糸口として考えていきたいと思います.
https://pbs.twimg.com/media/Dn7xzDhVYAE5jG_.jpg
Pythonで機械学習といえばscikit-learn
scikit-learnで機械学習に入門するのは
「自分もまだまだ模索中なのですが...」
APIの基本の理解が重要
fit, transform, predict
マニュアルとの向き合い方
最初から隅々まで読んで理解するのは難しい
数式がたくさん出てくるよ
アルゴリズムによってはユーザーガイドが付属してるので、それを読む
http://scikit-learn.org/stable/modules/svm.html#classification
http://scikit-learn.org/stable/_images/sphx_glr_plot_iris_0012.png
こういう画像を見ながら、パラメータを変えて見て、学ぶ
まとめ
scikit-learnを使いながら理解していくには、fit, transform, predict といったAPIの基本の理解が重要
アルゴリズムの挙動を確認する
編集側からみた本書の特徴と本書を読んでできるようになること (20:00〜20:20)
BPStudy#133〜Pythonによる機械学習・データ分析 - connpass
緑川敬紀
編集側から見た本書の特徴や進行の話を簡単に説明し、本書を読むことで何ができるようになるのかを話させて頂きます。
また、エンジニアではない編集の人間が本書を読むことで、できるようになったことの一例を紹介いたします。
「緑川たかのり」というスライドの表記が、「鈴木たかのり」にかぶせてきてる感じ
本の出版は企画から立案まで、7ヶ月から1年以上かかる
本書は、4月開始、9月発売で、5ヶ月!
完全に人海戦術
[** 銀の弾丸はあった!
出来ないこともあった
256ページと聞いていたので、2480円に設定したが、どんどん増えて、316ページに
技術書は1ページあたり10円前後、というのが一般的だけど、この本は7.8円。だいぶお買い得です
引用の許可どりが間に合わなかった(けど謝罪する前提でそのまま掲載、2刷で修正予定)
ページ数の調整がつかず索引が付けられなかった(1ページだけ残した)
書籍で学んだ内容を使って、Amazonレビューを分析してみた
(内容略)
おもしろかったw
第2部 機械学習案件でフレームワークを作った話 (20:20〜20:40)
BPStudy#133〜Pythonによる機械学習・データ分析 - connpass
清水川貴之 (Twitter: @shimizukawa )
はい。
https://gyazo.com/70a0fc276e17db945a8a093068bc6fc0
資料: https://docs.google.com/presentation/d/e/2PACX-1vQWSEZdZnT1ZgoaOBaR-XahQTPMU8G3pXKSJaj9HLKtETl6PPN3uKK3-YXXSxpPL7_y9ChcJz0z1ly6/pub?slide=id.p3
感想: 20分に収めるためにけっこう早口になってしまった。
懇親会でharuに聞いたら、もうちょっと時間使ってよかったみたい。
おれ「質疑応答時間が欲しかった」
haru「自分で質問ある人いますか、って聞けば良かったんですよ」
おれ「時間押してるのかと思って控えたんですよ!」
第3部 LT大会 (20:45〜21:00)
BPStudy#133〜Pythonによる機械学習・データ分析 - connpass
斉藤努さん
数理最適化とPyQの紹介
shimizukawa.iconちょっと発表で疲れてメモ取れなかった
おまけ
https://pbs.twimg.com/media/Dn8BFRQUUAEFNls.jpg
Pythonによるあたらしいデータ分析の教科書 のプレゼント争奪じゃんけん!